一个女士声称可以品出茶是先加奶还是先加茶. 给出
杯茶, 其中
杯先加奶. 女士全都说对了. 能说明她确实有品鉴能力吗?
引进假设该女士没有鉴别力. 如果正确, 则女士只是在进行随机挑选, 全部挑对的概率为这是小概率的事件, 因此拒绝.
如果女士只说对了杯, 发生的概率是这并不稀奇, 因此无法拒绝.
Fisher 用这个例子开创了假设检验的先河. 它的核心思想是承认某个假设成立, 然后考察它发生的偶然性. 当然后人在此基础上进一步完善了数学框架.
依据样本来推断一件事正确与否的命题叫做一个**(统计) 假设**; 对该假设判断是/否的程序称为这个假设的检验. 依据结果, 选择接受或者否定/拒绝这个假设.
设是的独立观察值, 是一个已知的分布函数, 维数与相同(是我们试图用来拟合的函数). 利用来检验假设为了检验这个假设, 设法找到一个量作为衡量与偏离程度的度量. 根据具体样本算出, 在成立的前提下计算称为在指标下样本和理论分布的拟合优度, 越高说明拟合越好. 设定一个阈值(通常很小, 例如), 在时否定, 时接受.
1 两种情况下的拟合优度检验
设的取值为有限的, 集中在的概率记为, 则假设为
其中已知, .
以记中等于的个数, 称为的观察频数, . 称为的理论频数, 事实上有. Pearson 引入了如下统计量: Pearson 统计量
如果成立, 则如果不成立则这个式子偏大; 再结合调整因子就构造出了这个式子.
若为真, 则样本大小时, 的分布收敛于, 即自由度为的分布. 即,直接从分布表上查找即可.
如果成立, 则从而的 特征函数 为令, 则. 而有特征函数两边取对数, 作 Taylor 展开, 得故
将二次型的方阵记为.
记, 作正交变换使的第一行为, 则由变换的正交性, 的特征函数为, 其中. 从而由 (1.3),但因此. 另一方面, 正交且第一行为, 因此除第一个元为外, 其余都是 , 从而, 从而回代入得因此时趋于一个维的各分量独立同分布于的分布, 故.
一家工厂有早中晚三班, 每班 8 小时. 近期的 15 起事故, 6 起在早班, 3 起在中班, 6 起在晚班, 判断事故是否与班次有关?
提出假设: 事故可能性与班次无关, 也即. 对本例, ; 则由 (1.1) 算出; 查自由度为的分布表, 知, 这并不稀奇, 因此并不能认为和班次有关.
试图用离散分布代替. 若是一维的, 寻找适当的, 进行划分; 若是维的,则要把划分为个彼此没有公共点的区域. 记 其中; 选择使, 记为中落在的个数, 进而作出 (1.1). 如果足够大, 选的足够好, 则可以与很接近.
1.2 理论分布带参数的情况
在很多时候, 检验的假设是的分布属于一个确定的分布族. 也即假设为存在使的分布为基本方法依然是依据前一个结果进行推广. 在这里自由度会变成.
定义(类似 (1.4)). 定义若满足以下条件
- 为的开集, , 使得的分布为;
- 对任意不同的, 有
- 在内连续;
- 令 为阶方阵; ;
- 方程组的解是的 弱相合估计.
则时, 依分布收敛于.
2.1 检验独立性
一个大量样本构成的总体, 每个个体有两个指标. 分为级: ; 分为级: . 从总体中抽出个个体, 测得第个的指标. 据此判断是否有关. 引入随机变量, 第个个体的观察结果记为. 如果相对于总数很小, 认为独立同分布, 问题等价于考察是否独立.
记
由概率论可知, 独立等价于, 且, 使得将视为参数, 则假设指标无关即独立具有我们前面的形式, 也即假定落在 (2.1), (2.2) 定义的二维分布族中.
记中取值的个数为. 则的似然函数为
取对数似然函数 在约束条件下构造 Lagrange 函数
求偏导得
根据上述推导, 极大值在上取到. 算出统计量的值按照 定理1.2,自由度为(中贡献了个独立参数, 中贡献了个独立参数). 最后, 指定阈值, 查表得出; 当时, 否定假设, 也即认为有关.
连续指标下, 采用类似的分割成若干区间的方法处理.
2.2 检验齐一性
有个包含大量个体的同类总体, 每个个体的指标为个等级的一个, 类似地定义等. 欲判断称为齐一性假设.
3 Kolmogorov 检验
这个检验的想法是依据来估计的分布函数, 判断是否接近给定的分布函数. 先设是一维的.
称定义在上的函数为的经验分布函数.